Linked Open Data

Concepto

Se entiende por Linked Open Data (Datos Abiertos Enlazados, LOD) la publicación de datos estructurados que permitan la conexión y enriquecimiento de los metadatos, de tal forma que “diferentes representaciones de un mismo contenido puedan encontrarse y enlazarse entre recursos relacionados” (Europeana Linked Open Data, 2014)

El objetivo del proyecto Linked Open Data (LOD) es la construcción de una base de conocimiento común mediante la publicación en la web de bases de datos en RDF y mediante el establecimiento de enlaces RDF entre datos de diferentes fuentes (Ríos, Martín, Ferreras, 2012). De tal modo que esta red mundial de datos se convierte así en uno de los pilares de la Web Semántica.

Análisis

La iniciativa Open Data está estrechamente relacionada y vinculada a la concepción de gobierno abierto. En este sentido, podemos definir Open data como “un movimiento que promueve la liberación de datos, generalmente no textuales y en formatos reutilizables como CSV (comma separated values), procedentes de organizaciones” (Peset; Ferrer-Sapena; Subirats-Coll, 2011).

En cuanto a las pautas a seguir para la publicación de estos datos, fueron establecidas por el W3C en el documento titulado Publishing Open Government Data (2009). Podemos resumir estas recomendaciones en los siguientes puntos:

  1. Publicación de los datos en bruto y en un formato que permita el uso automatizado (xml, rdf y csv).
  2. Creación de un catálogo en línea de dichos datos para que el usuario pueda conocer que datos se han publicado.
  3. Disposición de los datos de modo legible tanto por las personas como por las máquinas.

Berners Lee, desarrolló en 2010 un sistema de clasificación de clasificación de 5 estrellas con “con el fin de animar a la gente - especialmente a los propietarios de los datos del gobierno - en el camino hacia los buenos datos vinculados”. El desarrollo de este esquema es el que figura en la siguiente tabla:  

 

Los datos están disponibles en la web (cualquier formato), pero con una licencia abierta

★★

Los datos están disponibles como datos estructurados legibles por máquina (por ejemplo, Microsoft Excel en lugar de una imagen escaneada de una tabla).

★★★

Los datos están disponible como (2), pero en un formato no propietario (por ejemplo, CSV en lugar de Excel).

★★★★

Los datos están disponibles de acuerdo con todo lo anterior,  pero además se utilizan estándares abiertos de la W3C (RDF y SPARQL) para identificar las cosas, de tal modo que otras fuentes puedan apuntar a ellos.

★★★★★

Además de todo lo anterior: los datos contienen enlaces a otros conjuntos de datos, que ayudan a contextualizar y enriquecer la descripción de los recursos.

Fuente: Bernes-Lee, T. Linked Data – Design Issues, 2010

Linked Data (LD) es la forma que tiene la Web Semántica de vincular los distintos datos que están distribuidos en la Web, de tal manera que los datos se enlazan del mismo modo que lo hacen las páginas web. Parte del principio de aplicar la arquitectura general de la World Wide Web a la tarea de compartir datos estructurados en una escala global (Jacobs; Walsh, 2004).

De modo más preciso, la página oficial de Linked Data define este concepto como “la utilización de la Web para conectar los datos relacionados que no estaban vinculados previamente, o el uso de la Web para disminuir los obstáculos en la conexión de los datos actualmente vinculados mediante otros métodos” (2011).

El término datos vinculados se refiere, por lo tanto, a un conjunto de buenas prácticas para la publicación y la interconexión de datos estructurados en la Web. Para hablar de LD los datos deben publicarse de acuerdo con los principios diseñados para facilitar los vínculos entre los conjuntos de datos, elementos y vocabularios controlados (Berners-Lee, 2010). Estas prácticas fueron presentadas en 2006 por Tim Berners-Lee en su arquitectura Web nota Linked Data y se han dado a conocer como los principios de Linked Data. Tales principios son los siguientes:

  1. Usar URI como nombres para las cosas.
  2. Usar HTTP URI, por lo que las personas pueden buscar esos nombres.
  3. Cuando alguien busca un URI, proveer información útil, utilizando los estándares (RDF, SPARQL).
  4. Incluir enlaces a otros URI, para que puedan descubrir más cosas.

Según Mitchell (2013, p. 12) “LOD comprende dos conceptos distintos, el primero es que los datos publicados en la Web deberían conectarse fácilmente con información (“enlazados”) y al hacer esto debería ser accesible tanto para las computadoras como para los humanos (“datos”). EL segundo concepto clave para LOD es que para que los datos se vinculen  y se reutilicen, deben estar abiertos y libre de las restricciones de derechos y copyright (“abiertos”).

Para beneficiarse plenamente de Open Data, es crucial poner la información y los datos en un contexto que genere nuevo conocimiento y permita servicios y aplicaciones potentes. Puesto que LOD facilita la innovación y la creación de conocimiento mediante la vinculación de datos, es un importante mecanismo para la integración y gestión de la información. Existen dos puntos de vista igualmente importantes en LOD: publicar y consumir (Bauer, Kaltenböck, 2012, 17).

Aunque en algunos contextos se suele asimilar Linked Data con Linked Open Data, no todos los datos enlazados son datos abiertos – y no tienen por qué serlo. Sólo lo son si se liberan bajo acuerdos de licencia que permiten su libre reutilización. Es decir: mientras Linked Data alude a la interoperabilidad técnica de los datos, Open Data  hace referencia a su interoperabilidad legal (Ríos, Ferreras, Martín, 2014).

En el ámbito bibliotecario y sectores afines destaca la realización del informerealizado por el Library Linked Data Incubator Group. Su labor consistió en estudiar los componentes básicos ya existentes en este ámbito, tales como los modelos de metadatos y los estándares y protocolos de interoperabilidad, animando a las bibliotecas a publicar su contenido y en general a reorientar sus métodos para la interoperabilidad de los datos en la web, extendiéndose también a otras comunidades. El concepto de library data se utiliza en el informe en el sentido más amplio del término comprendiendo no sólo los datos bibliotecarios sino también los datos de archivos y de museos (Ríos; Martin; Ferreras, 2012). El resultado del estudio fue la publicación del documento Library Linked Data Incubator Group Final Report.

Implicaciones

Este panorama de datos abiertos y datos enlazados no es exclusivo de un determinado ámbito o de una determinada disciplina podemos hablar de este movimiento tanto en el ámbito científico, gubernamental o de los medios de comunicación por poner algunos ejemplos.

En la LOD cloud (nube de datos abiertos y enlazados) los conjuntos de datos se clasifican en las siguientes áreas temáticas: geográfica, gobierno, medios de comunicación, bibliotecas, ciencias de la vida, contenido generado por el usuario, y conjuntos de datos entre dominios. Esta última designación hace referencia a aquellos conjuntos de datos que aparecen en la web de los datos y que no son  específicos de un determinado tema, sino que afectaban a varios dominios. El referente de esta área es DBpedia, conjunto de datos cuyo propósito es “extraer la información estructurada de la Wikipedia y hacerla disponible en la Web (DBpedia, 2012)”.

Por su tradición y experiencia en la producción de datos estructurados de alta calidad, las bibliotecas son un complemento natural y juegan un papel fundamental en el desarrollo de los datos enlazados.

El grupo Library Linked Data recopila en la siguiente dirección  http://datahub.io/group/lld los conjuntos de datos del ámbito  bibliotecario, que ya ha sido publicados y están disponibles en el “Data Hub”. De este listado destacan, los proyectos referentes a las grandes bibliotecas nacionales, entre los que cabe citar los siguientes:

  • Bibliothèque nationale de France (BNF), con data.bnf.fr,
  • British Library, con Linked Open BNB,
  • Deutsche National Bibliothek (DNB), con Linked Data Service
  • Biblioteca Nacional de España, con datos.bne.es

También figuran como conjuntos de datos bibliotecarios las listas de encabezamientos tan importantes como la Library of Congress Subject Headings o RAMEAU (Répertoire d'autorité-matière encyclopédique et alphabétique unifié) y el Fichero de Autoridades Virtual Internacional (VIAF).

En esta misma sección se encuentra Europeana, la gran biblioteca digital europea que reúne millones de recursos digitales de archivos, bibliotecas y museos provenientes de más de 2300 instituciones europeas.

Dada la gran heterogeneidad de contenidos y dominios presentes en Europeana, se han llevado a cabo muchas acciones encaminadas a la interoperabilidad y establecimiento de un modelo de metadatos único. Para cumplir con este propósito, en primer lugar, se crea el Europeana Semantic Elements (ESE), que además de un conjunto de campos Dublin Core establecía una serie de elementos propios para Europena. Este modelo ha sido remplazado por el Europeana Data Model (EDM), cuyo objetivo primordial es ser “un medio de integración para recoger, conectar y enriquecer las descripciones proporcionadas por los proveedores de contenidos de Europeana” (Definition of the  Europeana Data Mode, 2013). Su arquitectura abierta hace a Europeana “compatible con el paradigma de la web semántica y le permite ser parte de la emergente comunidad de Linked Open Data” (Doeer, 2010).

Referencias

Bauer, F.,  Kaltenböck, M. (2012). Linked Open Data: The Essentials: a Quick Start Guide for Decision Makers. Viena : edition mono/monochrom.

Bernes-Lee, T. (2009). Linked Data – Design Issues. Recuperado el 9 de abril de 2014, de http://www.w3.org/DesignIssues/LinkedData.html

DBpedia (2012). Recuperado el 9 de abril de 2014, de http://dbpedia.org/About

Datahub (2013).Recuperado el 9 de abril de 2014, de http://datahub.io/group/lld

Definition of the  Europeana Data Model: v 5.2.4 (2013). Recuperado el 9 de abril de 2014, de http://pro.europeana.eu/documents/900548/0d0f6ec3-1905-4c4f-96c8-1d817c03123c

Doeer, M., et al. El modelo de datos Europeana (EDM), 2010. En: Ifla General Conference and Assembly (76º. 2010.Gotemburgo).  Information Technology, Cataloguing, Classification and Indexing with Knowledge Management. Traducción al español Ricardo Santos. [S.l.] : IFLA,2010. Disponible en: http://conference.ifla.org/past-wlic/2010/149-doerr-es.pdf

Europeana Linked Open Data (2014). Recuperado el 10 de abril de 2014, http://data.europeana.eu

Jacobs, I., & Walsh, N. (2004). Architecture of the World Wide Web, Volume One. Recuperado el 9 de abril de 2014, de http://www.w3.org/TR/webarch/

Linked Data - Connect Distributed Data across the Web (2011). Recuperado el 9 de abril de 2014, de http://linkeddata.org/

Mitchel, E. T. (2013). Library Linked Data: Research and Adoption. Library Technology Reports, 5 (49), 11-25.

Peset, F., Ferrer, A., & Subirats, I. (2011). Open data y Linked open data: su impacto en el área de bibliotecas y documentación. El profesional de la información, 20(2), 165-173.

Ríos, A., Martín, D., & Ferreras, T. (2012). Linked data y linked open data: su implantación en una biblioteca digital. El caso de Europeana. El profesional de la información, 21 (3), 292-297.

Ríos Hilario, A. B; Ferreras Fernández, T. ; Martín Campo, D. (2014).From bibliographic records to data : changes in the library environment with the application of linked open data technologies. Information Resources Management Journal [en prensa].

Fecha de ultima modificación: 2014-04-10